Model Selection

16kHz Audio Adaptation

# 16kHz Audio Adaptation

Whisper Medium Vaani Telugu

A Telugu automatic speech recognition model based on OpenAI Whisper-small architecture, optimized for Indian languages by the ARTPARK-IISc team

Speech Recognition Other

Hubert Large Superb Ks

Keyword detection model based on Hubert-Large architecture, excelling in SUPERB benchmark tests

Speech Recognition

Transformers English

Viwav2vec2 Base 100h

A base Wav2Vec2 model pretrained on 100 hours of unlabeled Vietnamese speech audio from the VLSP dataset, requiring fine-tuning for downstream tasks.

Speech Recognition

Transformers Other

Wav2vec2 Large Xlsr Bengali

A Bengali automatic speech recognition model fine-tuned based on facebook/wav2vec2-large-xlsr-53, trained using OpenSLR dataset.

Speech Recognition

SEW-tiny is a compressed and efficient speech pretraining model developed by ASAPP Research, pretrained on 16kHz sampled speech audio, suitable for various downstream speech tasks.

Speech Recognition

Transformers Supports Multiple Languages

Wav2vec2 Large Xlsr Hindi Marathi

Fine-tuned based on Facebook's wav2vec2-large-xlsr-53 model, supporting automatic speech recognition tasks for Hindi and Marathi

Speech Recognition

Transformers Other

Unispeech 1350 En 17h Ky Ft 1h

A speech recognition model based on Microsoft's UniSpeech architecture, specifically fine-tuned for the Kyrgyz language

Speech Recognition

Transformers Other

Sew D Base Plus 400k Ft Ls100h

SEW-D-base+ is an efficient speech recognition model developed by ASAPP Research, pre-trained on 16kHz sampled speech audio, and excels on the LibriSpeech dataset.

Speech Recognition

Transformers English

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase